Main results
Regression, logistic regression, cox :
epiDisplay패키지 기반으로 결과테이블 생성GEE, linear mixed model, GLMM : 자체 패키지 로 결과테이블 생성
Label 정보 적용.
Jinseob Kim
October 26, 2018
맞춤형 의학연구 애플리케이션을 위해
Rstudio와 shiny server가 설치된 Docker 이미지를 만들고 이것을 Docker swarm을 이용해 배포함으로써 서버의 종류와 갯수에 구애받지 않는 마이크로서비스 아키텍처(microservice architecture)를 구축하였으며
동적 프록시 서버(dynamic proxy server) 프로그램인 Traefik 을 이용하여 서비스가 추가될 때 마다(ex: 홈페이지, Jupyter) 이에 맞추어 https 보안이 적용된 subdomain 주소를 부여하였습니다.
흔히 이용되는 의학통계 방법들을 ShinyApps 로 만들어 위의 환경에 배포하였으며, 모든 앱에는 논문/보고서용 테이블과 그림을 위해 데이터 라벨(label) 정보를 적용하였습니다.
장점
깔끔하다.
치우기 쉽다.
다른 가방으로 옮기기 쉽다.
가방 종류에 구애받지 않는다.
단점
실제 쓸 수 있는 공간이 줄어든다.
분리해서 넣기 귀찮다.
물건 찾을 때 지퍼를 한번 더 열어야 된다.
장점
깔끔하다.
삭제가 쉽다.
다른 컴퓨터에 재설치 쉽다.
컴퓨터/서버 종류에 구애받지 않는다.
단점
실제 쓸 수 있는 용량이 줄어든다.
서비스마다 모듈 만들기 귀찮다.
성능저하 우려
가상머신(Virtual machine) 활용이 대표적.
VM vs Docker
https://subicura.com/2017/01/19/docker-guide-for-beginners-1.html
docker run --rm -d -p 3838:3838 -p 8787:8787 \
-e USER=js -e PASSWORD=js -e ROOT=TRUE\
jinseob2kim/docker-rshiny
shiny server)와 연결, 8787포트를 8787포트(rstudio server)에 연결Rstudio와 shiny server가 설치된 Docker 이미지를 만들고 이것을 Docker swarm을 이용해 배포함으로써 서버의 종류와 갯수에 구애받지 않는 마이크로서비스 아키텍처(microservice architecture)를 구축하였으며서버의 갯수에 구애받지 않는다? Docker 만으로는 불가능.
Docker vs Docker swarm
manger_ip = $(123.456.789.10)
# Init Docker Swarm mode: In manager node
docker swarm init --advertise-addr $manager_ip
# Get Swarm tokens
worker_token=$(docker swarm join-token worker -q)
# Join worker nodes: In worker node
docker swarm join --token $worker_token $manager_ip:2377
연결 가능한 서버끼리만 묶을 수 있다.
AWS끼리(O), Azure끼리(O), Digitalocean끼리(O)
AWS와 Azure(X), AWS와 Digitalocean(X)
AWS(Azure, Digitalocean)와 자체서버(X)
자체적으로 이미지 docker-rshiny 를 만들어 사용하였다.
docker service create \
--name rshiny \
--publish 8787:8787 \
--publish 3838:3838 \
-e USER=js -e PASSWORD=js -e ROOT=TRUE \
jinseob2kim/docker-rshiny
Manger node와 worker node 주소 모두에서 8787 포트로 rstudio server를, 3838 포트로 shiny server를 실행할 수 있다.
추가: tensorflow docker 실행
docker service create \
--name tf \
--publish 8888:8888\
tensorflow/tensorflow
어떤 ip로 접속해도 실행 가능
docker service scale 명령어 이용
docker service scale rshiny=2
다시 줄이기
docker service scale rshiny=1
base=https://github.com/docker/machine/releases/download/v0.15.0 &&
curl -L $base/docker-machine-$(uname -s)-$(uname -m) >/tmp/docker-machine &&
sudo install /tmp/docker-machine /usr/local/bin/docker-machine
docker-machine version
export DIGITALOCEAN_ACCESS_TOKEN=<YOUR_DIGITALOCEAN_ACCESS_TOKEN>
export DIGITALOCEAN_IMAGE="ubuntu-18-04-x64"
export DIGITALOCEAN_REGION="sgp1"
echo "### Creating manager nodes ..."
for c in {1..1} ; do
docker-machine create \
--driver digitalocean \
--digitalocean-access-token $DIGITALOCEAN_ACCESS_TOKEN \
--digitalocean-image $DIGITALOCEAN_IMAGE \
--digitalocean-region $DIGITALOCEAN_REGION \
--digitalocean-size "s-2vcpu-4gb" \
manager$c &&\
docker-machine ssh manager$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
export AWS_ACCESS_KEY_ID=<YOUR_AWS_ACEESS_KEY_ID>
export AWS_SECRET_ACCESS_KEY=<YOUR_AWS_SECRET_ACCESS_KEY>
export AWS_INSTANCE_TYPE="t2.micro"
export AWS_INSTANCE_REGION="ap-northeast-2"
export AWS_SECURITY_GROUP="launch-wizard-2"
export AWS_VPC_ID=<YOUR_AWS_VPC_ID>
export AWS_ZONE=c
for c in {1..1} ; do
docker-machine create \
--driver amazonec2 \
--amazonec2-access-key $AWS_ACCESS_KEY_ID \
--amazonec2-secret-key $AWS_SECRET_ACCESS_KEY \
--amazonec2-region $AWS_INSTANCE_REGION \
--amazonec2-vpc-id $AWS_VPC_ID \
--amazonec2-open-port 3838 \
--amazonec2-open-port 8787 \
--amazonec2-open-port 8000 \
--amazonec2-open-port 8080 \
--amazonec2-open-port 2377 \
--amazonec2-open-port 7946 \
--amazonec2-open-port 7946/udp \
--amazonec2-open-port 4789 \
--amazonec2-open-port 4789/udp \
--amazonec2-open-port 8888 \
--amazonec2-open-port 80 \
--amazonec2-open-port 443 \
manager$c && \
docker-machine ssh manager$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
export sub=<YOUR_AZURE_SUBSCRIPTION_VALUE>
for c in {1..1} ; do
docker-machine create \
--driver azure \
--azure-location "koreacentral" \
--azure-size Standard_B1s \
--azure-subscription-id $sub \
--azure-open-port 3838 \
--azure-open-port 8787 \
--azure-open-port 8000 \
--azure-open-port 8080 \
--azure-open-port 2377 \
--azure-open-port 7946 \
--azure-open-port 7946/udp \
--azure-open-port 4789 \
--azure-open-port 4789/udp \
--azure-open-port 8888 \
--azure-open-port 80 \
--azure-open-port 443 \
manager$c && \
docker-machine ssh manager$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
export DIGITALOCEAN_SIZE="s-1vcpu-1gb"
echo "### Creating worker nodes ..."
for c in {1..1} ; do
docker-machine create \
--driver digitalocean \
--digitalocean-access-token $DIGITALOCEAN_ACCESS_TOKEN \
--digitalocean-image $DIGITALOCEAN_IMAGE \
--digitalocean-region $DIGITALOCEAN_REGION \
--digitalocean-size $DIGITALOCEAN_SIZE \
worker$c && \
docker-machine ssh worker$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
manager1 과 worker1 노드를 docker swarm를 활용하여 묶자.
# Get IP from leader node
leader_ip=$(docker-machine ip manager1)
# Init Docker Swarm mode
echo "### Initializing Swarm mode ..."
eval $(docker-machine env manager1)
docker swarm init --advertise-addr $leader_ip
# Swarm tokens
manager_token=$(docker swarm join-token manager -q)
worker_token=$(docker swarm join-token worker -q)
# Joinig manager nodes
echo "### Joining manager modes ..."
for c in {1..1} ; do
eval $(docker-machine env manager$c)
docker swarm join --token $manager_token $leader_ip:2377
done
# Join worker nodes
echo "### Joining worker modes ..."
for c in {1..1} ; do
eval $(docker-machine env worker$c)
docker swarm join --token $worker_token $leader_ip:2377
done
# Clean Docker client environment
echo "### Cleaning Docker client environment ..."
eval $(docker-machine env -u)
/server, /app 으로는 안되나?리버스 프록시(reverse proxy) 프로그램이 필요하다.
서비스 실행해서 포트 추가될 때마다 일일히 주소 적용해줘야됨.
Docker swarm 과는 더 안좋다.
https 적용 불가능따로 비용을 지불하거나
무료 https 적용 프로그램인 Let’s Encrypt 를 수동으로 적용해야됨.
Docker swarm 을 위한 dynamic proxy 프로그램
rstudio server 서비스 추가하면 rstudio.DOMAINNAME 로 자동으로 subdomain 적용. tensorflow 서비스 추가하면 tensorflow.DOMAINNAME 으로 적용.
https 자동 적용됨: Let’s Encrypt 연계
https://ian-says.com/articles/traefik-proxy-docker-lets-encrypt/
eval $(docker-machine env manager1)
DOMAINNAME="anpanman.co.kr"
# Create network for swarm
docker network create --driver=overlay traefik-net
빈 acme.json 파일을 만든다 (읽기쓰기 가능).
세부 설정이 담긴 traefik.toml 을 만든다.
# For Let's Encrypt
docker-machine ssh manager1 "DOMAINNAME=anpanman.co.kr && \
mkdir /home/js/opt && \
mkdir /home/js/opt/traefik && \
cd /home/js/opt/traefik && \
touch acme.json && chmod 600 acme.json && \
wget -O traefik.toml https://raw.githubusercontent.com/jinseob2kim/swarm-setting/master/opt/traefik/traefik.toml"
# Create traefik service
docker service create \
--name traefik \
--constraint=node.role==manager \
--publish 80:80 --publish 443:443\
--mount type=bind,source=/var/run/docker.sock,target=/var/run/docker.sock \
--mount type=bind,source=/root/acme.json,target=/acme.json \
--mount type=bind,source=/root/traefik.toml,target=/traefik.toml \
-e DO_AUTH_TOKEN=$DIGITALOCEAN_ACCESS_TOKEN \
-l traefik.port=8080 \
-l traefik.frontend.rule=Host:monitor.$DOMAINNAME\
--network traefik-net \
traefik \
--logLevel=INFO \
--docker \
--docker.swarmMode \
--docker.watch \
--docker.domain=$DOMAINNAME
https://monitor.anpanman.co.kr 에서 dashboard를 볼 수 있다.
Traefik 를 적용하여 재실행하자.
docker service create \
--name rshiny \
--label traefik.shiny.port=3838 \
--label traefik.rstudio.port=8787 \
--label traefik.shiny.frontend.rule="Host:app.anpanman.co.kr" \
--label traefik.rstudio.frontend.rule="Host:server.anpanman.co.kr" \
-e USER=js -e PASSWORD=js -e ROOT=TRUE \
--network traefik-net \
jinseob2kim/docker-rshiny
https://server.anpanman.co.kr 에서 ’rstudio server’를, https://app.anpanman.co.kr 에서 ’shiny server’를 실행할 수 있다.
proxy server 프로그램인 nginx의 docker image 를 이용하였고, blogdown 패키지 를 활용해서 홈페이지를 만들었다.
docker service create \
--name nginx \
--label traefik.port=80 \
--label traefik.frontend.rule="Host:${DOMAINNAME},www.${DOMAINNAME}"
--network traefik-net \
nginx
https://anpanman.co.kr, https://www.anpanman.co.kr 에서 nginx 실행환경을 볼 수 있다.
필요한 서비스를 미리 Docker image 로 만들었다.
Docker-machine 을 이용하여 Docker가 설치된 클라우드 서버를 여러 개 생성한 후
Docker swarm 을 통해 서버들을 묶었다.
이제 서비스를 실행하면 Swarm 환경이 알아서 적절한 서버를 골라 실행한다.
Traefik 을 이용하여 서비스를 추가할 때마다 그에 맞는 subdomain 주소를 자동으로 할당하였다.
Let’s Encrypt 을 통한 https 인증이 자동으로 적용된다.
ShinyApps 만들기데이터: data.table, DT
통계분석: tableone, epiDisplay, survival, geepack, lme4, plotROC, pROC
Plot: ggplot2, GGally, svglite
패키지: devtools, roxygen2
Shiny: shinycustomloader, shiny.i18n
DT반응형 테이블 패키지
셀 강조 (ex: 색깔) : formatStyle 옵션
엑셀 파일로 바로 다운로드 : Buttons 옵션
datatable(iris, extension= "Buttons",
options = list(dom = '<lf<rt>Bip>', lengthMenu = list(c(10, 25, -1), c('10', '25', 'All')), pageLength = 10,
buttons = list('copy', 'print',
list(extend = 'collection',
buttons = list(list(extend = 'csv', filename= "table"),
list(extend = 'excel', filename= "table"),
list(extend = 'pdf', filename= "table")
),
text = 'Download')
)
)
) %>%
formatStyle('Sepal.Length', fontWeight = styleInterval(5, c('normal', 'bold'))) %>%
formatStyle(
'Sepal.Width',
color = styleInterval(c(3.4, 3.8), c('white', 'blue', 'red')),
backgroundColor = styleInterval(3.4, c('gray', 'yellow'))
) %>%
formatStyle(
'Petal.Length',
background = styleColorBar(iris$Petal.Length, 'steelblue'),
backgroundSize = '100% 90%',
backgroundRepeat = 'no-repeat',
backgroundPosition = 'center'
) %>%
formatStyle(
'Species',
transform = 'rotateX(45deg) rotateY(20deg) rotateZ(30deg)',
backgroundColor = styleEqual(
unique(iris$Species), c('lightblue', 'lightgreen', 'lightpink')
)
)Regression, logistic regression, cox : epiDisplay 패키지 기반으로 결과테이블 생성
GEE, linear mixed model, GLMM : 자체 패키지 로 결과테이블 생성
Label 정보 적용.
GGally : ggpair 함수로 변수 비교
svglite: svg 포맷으로 그림 저장하여 ppt에서 수정 가능.